仿真环境的兴起已经实现了基于学习的组装计划的方法,否则这是一项劳动密集型和艰巨的任务。组装家具特别有趣,因为家具是复杂的,对基于学习的方法构成了挑战。令人惊讶的是,人类可以解决组装产品的2D快照。尽管近年来见证了家具组装的有希望的基于学习的方法,但他们假设每个组装步骤都有正确的连接标签,这在实践中很昂贵。在本文中,我们减轻了这一假设,并旨在以尽可能少的人类专业知识和监督来解决家具。具体而言,我们假设组装点云的可用性,并比较当前组件的点云和目标产品的点云,请根据两种措施获得新的奖励信号:不正确和不完整。我们表明,我们的新颖奖励信号可以训练一个深层网络,以成功组装不同类型的家具。可用的代码和网络:https://github.com/metu-kalfa/assemblerl
translated by 谷歌翻译